MENU

#LLM Agent

Research

DCA-Bench: A Benchmark for Dataset Curation Agents

Benhao Huang, Yingzhuo Yu, Jin Huang, Xingjian Zhang, Jiaqi W. Ma

May 1st 2025

KDD-2025 DB Track (Oral), ICML-2025 Data World

#Data-centric AI

A benchmark exploring the performance of LLM Agents on detecting issues in datasets hosted on popular platforms.

🤗HuggingFace

DCA-Bench: A Benchmark for Dataset Curation Agents